home *** CD-ROM | disk | FTP | other *** search
/ Aminet 1 (Walnut Creek) / Aminet - June 1993 [Walnut Creek].iso / usenet / sources / volume90 / unix / cpp / part04 / Cpp1.c
Text File  |  1990-01-18  |  27KB  |  790 lines

  1. /*
  2.  * CPP main program.
  3.  *
  4.  * Edit history
  5.  * 21-May-84    MM    "Field test" release
  6.  * 23-May-84    MM    Some minor hacks.
  7.  * 30-May-84    ARF    Didn't get enough memory for __DATE__
  8.  *            Added code to read stdin if no input
  9.  *            files are provided.
  10.  * 29-Jun-84    MM    Added ARF's suggestions, Unixifying cpp.
  11.  * 11-Jul-84    MM    "Official" first release (that's what I thought!)
  12.  * 22-Jul-84    MM/ARF/SCK Fixed line number bugs, added cpp recognition
  13.  *            of #line, fixed problems with #include.
  14.  * 23-Jul-84    MM    More (minor) include hacking, some documentation.
  15.  *            Also, redid cpp's #include files
  16.  * 25-Jul-84    MM    #line filename isn't used for #include searchlist
  17.  *            #line format is <number> <optional name>
  18.  * 25-Jul-84    ARF/MM    Various bugs, mostly serious.  Removed homemade doprint
  19.  * 01-Aug-84    MM    Fixed recursion bug, remove extra newlines and
  20.  *            leading whitespace from cpp output.
  21.  * 02-Aug-84    MM    Hacked (i.e. optimized) out blank lines and unneeded
  22.  *            whitespace in general.    Cleaned up unget()'s.
  23.  * 03-Aug-84    Keie    Several bug fixes from Ed Keizer, Vrije Universitet.
  24.  *            -- corrected arg. count in -D and pre-defined
  25.  *            macros.  Also, allow \n inside macro actual parameter
  26.  *            lists.
  27.  * 06-Aug-84    MM    If debugging, dump the preset vector at startup.
  28.  * 12-Aug-84    MM/SCK    Some small changes from Sam Kendall
  29.  * 15-Aug-84    Keie/MM cerror, cwarn, etc. take a single string arg.
  30.  *            cierror, etc. take a single int. arg.
  31.  *            changed LINE_PREFIX slightly so it can be
  32.  *            changed in the makefile.
  33.  * 31-Aug-84    MM    USENET net.sources release.
  34.  *  7-Sep-84    SCH/ado Lint complaints
  35.  * 10-Sep-84    Keie    Char's can't be signed in some implementations
  36.  * 11-Sep-84    ado    Added -C flag, pathological line number fix
  37.  * 13-Sep-84    ado    Added -E flag (does nothing) and "-" file for stdin.
  38.  * 14-Sep-84    MM    Allow # 123 as a synonym for #line 123
  39.  * 19-Sep-84    MM    scanid always reads to token, make sure #line is
  40.  *            written to a new line, even if -C switch given.
  41.  *            Also, cpp - - reads stdin, writes stdout.
  42.  * 03-Oct-84    ado/MM    Several changes to line counting and keepcomments
  43.  *            stuff.    Also a rewritten control() hasher -- much
  44.  *            simpler and no less "perfect". Note also changes
  45.  *            in cpp3.c to fix numeric scanning.
  46.  * 04-Oct-84    MM    Added recognition of macro formal parameters if
  47.  *            they are the only thing in a string, per the
  48.  *            draft standard.
  49.  * 08-Oct-84    MM    One more attack on scannumber
  50.  * 15-Oct-84    MM/ado    Added -N to disable predefined symbols.  Fixed
  51.  *            linecount if COMMENT_INVISIBLE enabled.
  52.  * 22-Oct-84    MM    Don't evaluate the #if/#ifdef argument if
  53.  *            compilation is supressed.  This prevents
  54.  *            unnecessary error messages in sequences such as
  55.  *                #ifdef FOO        -- undefined
  56.  *                #if FOO == 10    -- shouldn't print warning
  57.  * 25-Oct-84    MM    Fixed bug in false ifdef supression.  On vms,
  58.  *            #include <foo> should open foo.h -- this duplicates
  59.  *            the behavior of Vax-C
  60.  * 31-Oct-84    ado/MM    Parametized $ in indentifiers.    Added a better
  61.  *            token concatenator and took out the trial
  62.  *            concatenation code.  Also improved #ifdef code
  63.  *            and cleaned up the macro recursion tester.
  64.  *  2-Nov-84    MM/ado    Some bug fixes in token concatenation, also
  65.  *            a variety of minor (uninteresting) hacks.
  66.  *  6-Nov-84    MM    Happy Birthday.  Broke into 4 files and added
  67.  *            #if sizeof (basic_types)
  68.  *  9-Nov-84    MM    Added -S* for pointer type sizes
  69.  * 13-Nov-84    MM    Split cpp1.c, added vms defaulting
  70.  * 23-Nov-84    MM/ado    -E supresses error exit, added CPP_INCLUDE,
  71.  *            fixed strncpy bug.
  72.  *  3-Dec-84    ado/MM    Added OLD_PREPROCESSOR
  73.  *  7-Dec-84    MM    Stuff in Nov 12 Draft Standard
  74.  * 17-Dec-84    george    Fixed problems with recursive macros
  75.  * 17-Dec-84    MM    Yet another attack on #if's (f/t)level removed.
  76.  * 07-Jan-85    ado    Init defines before doing command line options
  77.  *            so -Uunix works.
  78.  * 21-Oct-85    RMS    Rename `token' to `tokenbuf'.
  79.  *            Allocate it dynamically, with size in `tokenbsize'.
  80.  * 23-Oct-85    RMS    Do not print message about number of errors.
  81.  * 14-Mar-85    FNF    Incorporate macro based C debugging package.
  82.  *            Port to Commodore AMIGA.
  83.  * 20-Aug-88    Ois    Changed format of documentation.
  84.  */
  85.  
  86. /*)BUILD
  87.     $(PROGRAM)      = cpp
  88.     $(FILES)        = { cpp1 cpp2 cpp3 cpp4 cpp5 cpp6 }
  89.     $(INCLUDE)      = { cppdef.h cpp.h }
  90.     $(STACK)        = 2000
  91.     $(TKBOPTIONS)   = {
  92.         STACK    = 2000
  93.     }
  94. */
  95.  
  96. #ifdef    DOCUMENTATION
  97. .TH CPP 1 "Amiga Programmer's Manual" "1st PDC distribution"
  98. .SH NAME
  99. .bo "cpp
  100. - C Pre Processor. Macro-preprocess C programs.
  101. .SH SYNOPSIS
  102. .nf
  103. cpp [-options] [infile [outfile]]
  104. .fi
  105. .SH DESCRIPTION
  106. CPP reads a C source file, expands macros and include files, and writes an
  107. input file for the C compiler. If no file arguments are given, CPP reads
  108. from stdin and writes to stdout.  If one file argument is given, it will
  109. define the input file, while two file arguments define both input and
  110. output files.  The file name "-" is a synonym for stdin or stdout as
  111. appropriate.
  112.  
  113. The following options are supported.  Options may be given in either case.
  114. .in +5
  115. .ta +0
  116. .sp
  117. .ti -5
  118. -C@tIf set, source-file comments are written to the output file.  This
  119. allows the output of CPP to be used as the input to a program, such as
  120. lint, that expects commands embedded in specially-formatted comments.
  121. .sp
  122. .ti -5
  123. -Dname=value
  124. .br
  125. Define the name as if the programmer wrote
  126.  
  127.     #define name value
  128.  
  129. at the start of the first file.  If "=value" is not given, a value of "1"
  130. will be used.
  131.  
  132. On non-unix and non-amiga systems, all alphabetic text will be forced to
  133. upper-case.
  134. .sp
  135. .ti -5
  136. -E@tAlways return "success" to the operating system, even if errors were
  137. detected.  Note that some fatal errors, such as a missing #include file,
  138. will terminate CPP, returning "failure" even if the -E option is given.
  139. .sp
  140. .ti -5
  141. -Idirectory
  142. .br
  143. Add this directory to the list of directories searched for #include "..."
  144. and #include <...> commands.  Note that there is no space between the "-I"
  145. and the directory string.  More than one -I command is permitted.  On
  146. non-Unix systems "directory" is forced to upper-case.
  147. .sp
  148. .ti -5
  149. -N@tCPP normally predefines some symbols defining the target computer and
  150. operating system.  If -N is specified, no symbols will be predefined.  If
  151. -N -N is specified, the "always present" symbols, __LINE__, __FILE__,
  152. __TIME__ and __DATE__ are not defined.
  153. .sp
  154. .ti -5
  155. -Stext
  156. .br
  157. CPP normally assumes that the size of the target computer's basic variable
  158. types is the same as the size of these types of the host computer.  (This
  159. can be overridden when CPP is compiled, however.)  The -S option allows
  160. dynamic respecification of these values.  "text" is a string of numbers,
  161. separated by commas, that specifies correct sizes. The sizes must be
  162. specified in the exact order:
  163.  
  164.     char short int long float double
  165.  
  166. If you specify the option as "-S*text", pointers to these types will be
  167. specified.  -S* takes one additional argument for pointer to function (e.g.
  168. int (*)())
  169.  
  170. For example, to specify sizes appropriate for a PDP-11, you would write:
  171.  
  172.        c s i l f d func
  173.      -S1,2,2,2,4,8,
  174.     -S*2,2,2,2,2,2,2
  175.  
  176. Note that all values must be specified.
  177. .br;.it -1
  178. Note also that this is not allowed by the 11-Jan-88 Draft, and therefore
  179. has made into an option when compiling Cpp.
  180. .it 0
  181. .sp
  182. .ti -5
  183. -Uname
  184. .br
  185. Undefine the name as if
  186.  
  187.     #undef name
  188.  
  189. were given.  On non-Unix systems, "name" will be forced to upper-case.
  190. .sp
  191. .ti -5
  192. -Xnumber
  193. .br
  194. Enable debugging code.    If no value is given, a value of 1 will be used.
  195. (For maintenence of CPP only.)
  196. .in -5
  197. .SH Pre-Defined Variables
  198. When CPP begins processing, the following variables will have been defined
  199. (unless the -N option is specified):
  200. .sp
  201. Target computer (as appropriate):
  202. .sp
  203.     pdp11, vax, M68000 m68000 m68k, amiga
  204. .sp
  205. Target operating system (as appropriate):
  206. .sp
  207.     rsx, rt11, vms, unix, amigados
  208. .sp
  209. Target compiler (as appropriate):
  210. .sp
  211.     decus, vax11c, pdc PDC __PDC__
  212. .sp
  213. The implementor may add definitions to this list. The default definitions
  214. match the definition of the host computer, operating system, and C
  215. compiler.
  216. .sp
  217. The following are always available unless undefined (or -N was specified
  218. twice):
  219.  
  220. .in +16
  221. .ta
  222. .ta +0
  223. .ti -12
  224. __FILE__@tThe input (or #include) file being compiled (as a quoted string).
  225. .ti -12
  226. __LINE__@tThe line number being compiled.
  227. .ti -12
  228. __DATE__@tThe date of compilation as a quoted string of the format
  229. "Mmm dd yyyy".
  230. .ti -12
  231. __TIME__@tThe time of the start of compilation as a quoted string of the
  232. format "hh:mm:ss". Thus,
  233. .br
  234.     printf("Bug at line %s,", __LINE__);
  235.     printf(" source file %s", __FILE__);
  236.     printf("@ compiled@ on@ %s@ %s", __DATE__, __TIME__);
  237. .br
  238. .in -16
  239. .SH Supported directives
  240. .br;    #assert <expression>
  241. .br;    #define <token> <replacement>
  242. .br;    #elif <expression>
  243. .br;    #else <expression>
  244. .br;    #endif
  245. .br;    #error
  246. .br;    #if <expression>
  247. .br;    #ifdef <token>
  248. .br;    #ifndef <token>
  249. .br;    #include <filename>
  250. .br;    #line <number> <filename>
  251. .br;    #pragma <anything>
  252. .br;    #undef <token>
  253. .br;    #debug
  254. .br;    #nodebug
  255. .sp
  256. Unsupported # commands are copied verbatim into the output, so that maybe
  257. the compiler knows what to do with them.
  258. .SH Draft Proposed Ansi Standard Considerations
  259. The current version of the Draft Proposed Standard explicitly states that
  260. "readers are requested not to specify or claim conformance to this draft."
  261. Readers and users of Decus CPP should not assume that Decus CPP conforms to
  262. the standard, or that it will conform to the actual C Language Standard.
  263.  
  264. When CPP is itself compiled, many features of the Draft Proposed Standard
  265. that are incompatible with existing preprocessors may be disabled.  See the
  266. comments in CPP's source for details.
  267.  
  268. The latest version of the Draft Proposed Standard (as reflected in Decus
  269. CPP) is dated November 12, 1984, and bits from K&R V2 are put in by Ois.
  270.  
  271. Comments are removed from the input text.  The comment is replaced by a
  272. single space character.  The -C option preserves comments, writing them to
  273. the output file.
  274.  
  275. The '$' character is considered to be a letter.  This is a permitted
  276. extension.
  277.  
  278. The following new features of C are processed by CPP:
  279. .sp
  280. .* The following .br commands are there so the preprocessor
  281. .* does not get confused when compiling cpp1.c
  282. .nf
  283. .br;    #if, #elif
  284. .br;    #elif expression    (#else #if)
  285. .br;    '\xNNN'                 (Hexadecimal constant)
  286. .br;    '\a'                    (Ascii BELL)
  287. .br;    '\v'                    (Ascii Vertical Tab)
  288. .br;    #if defined NAME    1 if defined, 0 if not
  289. .br;    #if defined (NAME)      1 if defined, 0 if not
  290. .br;    #if sizeof (basic type)
  291. .br;    #error            Generates error message
  292. .br;    unary +
  293. .br;    123U, 123LU        Unsigned ints and longs.
  294. .br;    12.3L            Long double numbers
  295. .br;    token##token        Token concatenation in macros
  296. .br;    #macro-formal        String generation in macros
  297. .br;    #include token        Expands to filename
  298. .fi
  299.  
  300. The Draft Proposed Standard has extended C, adding a constant string
  301. concatenation operator, where
  302.  
  303.     "foo" "bar"
  304.  
  305. is regarded as the single string "foobar".  (This does not affect CPP's
  306. processing but does permit a limited form of macro argument substitution
  307. into strings as will be discussed.)
  308.  
  309. The Standard Committee plans to add token concatenation to #define command
  310. lines.    One suggested implementation is as follows:  the sequence
  311. "Token1 ## Token2" is treated as if the programmer wrote "Token1Token2".
  312.  
  313. This could be used as follows:
  314.  
  315.     #line 123
  316.     #define ATLINE foo ## __LINE__
  317.  
  318. ATLINE would be defined as foo123.
  319.  
  320. Note that "Token1" and "Token2" both must be valid tokens, but the
  321. concatenation of their expanded forms may not be a _single_ valid token. In
  322. that case, K&R state that the behaviour is undefined. So if you wish to
  323. make portable use of this facility, do not do the following:
  324.  
  325.     #define cat(x, y)   x ## y
  326.     cat(foo, 1.23)
  327.  
  328. which will produce
  329.  
  330.     foo1.23
  331.  
  332. and that is not a single token.
  333.  
  334. If the tokens T1 and T2 are concatenated into T3, this implementation
  335. operates as follows:
  336.  
  337.   1.@ Expand T1 if it is a macro.
  338.   2.@ Expand T2 if it is a macro.
  339.   3.@ Join the tokens, forming T3.
  340.   4.@ Rescan T3, looking for tokens, that may be expanded again.
  341.  
  342.       A macro formal parameter will be substituted into a string or
  343. character constant if it is the only component of that constant:
  344.  
  345.     #define VECSIZE 123
  346.     #define vprint(name, size) \
  347.       printf("name" "[" "size" "] = {\n")
  348.       ... vprint(vector, VECSIZE);
  349.  
  350. expands (effectively) to
  351.  
  352.       vprint("vector[123] = {\n");
  353.  
  354. Note that this will be useful if your C compiler supports the new string
  355. concatenation operation noted above. As implemented here, if you write
  356.  
  357.     #define string(arg) "arg"
  358.       ... string("foo") ...
  359.  
  360. This implementation generates "foo", rather than the strictly correct
  361. ""foo"" (which will probably generate an error message). This is, strictly
  362. speaking, an error in CPP and may be removed from future releases.
  363. .it -1
  364. Note that the above feature of replacing macro formals inside quotes is
  365. non-standard. The Committee thought the following to be better:
  366. .it 0
  367. .sp
  368. If a macro formal argument is immediately preceeded by a #, the argument
  369. supplied when expanding the macro will be surrounded by double quotes, and
  370. each double quote or backslash will be preceeded by a backslash. An example
  371. of this would be:
  372.  
  373.     #define string(arg) #arg
  374.       ... string(foo) ...
  375.  
  376. which produces "foo". Note that this feature is useless if you want your
  377. string to contain an odd number of quotes:
  378.  
  379.     string(Hello");
  380.  
  381. will produce an error message, complaining about unterminated strings.
  382.  
  383. .SH Error messages
  384. Many.  CPP prints warning or error messages if you try to use multiple-byte
  385. character constants (non-transportable) if you #undef a symbol that was not
  386. defined, or if your program has potentially nested comments.
  387. .SH Author
  388. Martin Minow, minor changes by RMS, FNF, OIS.
  389. .SH Bugs
  390. The #if expression processor uses signed integers only.
  391. I.e, #if 0xFFFFu < 0 may be TRUE.
  392. #endif    /* DOCUMENTATION */
  393.  
  394. #include    <stdio.h>
  395. #include    <ctype.h>
  396. #include    "cppdef.h"
  397. #include    "cpp.h"
  398.  
  399. /*
  400.  * Commonly used global variables:
  401.  * line     is the current input line number.
  402.  * wrongline    is set in many places when the actual output
  403.  *        line is out of sync with the numbering, e.g,
  404.  *        when expanding a macro with an embedded newline.
  405.  *
  406.  * tokenbuf    holds the last identifier scanned (which might
  407.  *        be a candidate for macro expansion).
  408.  * errors    is the running cpp error counter.
  409.  * infile    is the head of a linked list of input files (extended by
  410.  *        #include and macros being expanded).  infile always points
  411.  *        to the current file/macro.  infile->parent to the includer,
  412.  *        etc.  infile->fd is NULL if this input stream is a macro.
  413.  */
  414. int        line;            /* Current line number        */
  415. int        wrongline;        /* Force #line to compiler    */
  416. char        *tokenbuf;        /* Buffer for current input token */
  417. int        tokenbsize;        /* Allocated size of tokenbuf, */
  418.                     /* not counting zero at end.  */
  419. int        errors;         /* cpp error counter        */
  420. FILEINFO    *infile = NULL;     /* Current input file        */
  421. #if DEBUG
  422. int        debug;            /* TRUE if debugging now    */
  423. #endif
  424. /*
  425.  * This counter is incremented when a macro expansion is initiated.
  426.  * If it exceeds a built-in value, the expansion stops -- this tests
  427.  * for a runaway condition:
  428.  *    #define X Y
  429.  *    #define Y X
  430.  *    X
  431.  * This can be disabled by falsifying rec_recover.  (Nothing does this
  432.  * currently: it is a hook for an eventual invocation flag.)
  433.  */
  434. int        recursion;        /* Infinite recursion counter    */
  435. int        rec_recover = TRUE;    /* Unwind recursive macros    */
  436.  
  437. /*
  438.  * instring is set TRUE when a string is scanned.  It modifies the
  439.  * behavior of the "get next character" routine, causing all characters
  440.  * to be passed to the caller (except <DEF_MAGIC>).  Note especially that
  441.  * comments and \<newline> are not removed from the source.  (This
  442.  * prevents cpp output lines from being arbitrarily long).
  443.  *
  444.  * inmacro is set by #define -- it absorbs comments and converts
  445.  * form-feed and vertical-tab to space, but returns \<newline>
  446.  * to the caller.  Strictly speaking, this is a bug as \<newline>
  447.  * shouldn't delimit tokens, but we'll worry about that some other
  448.  * time -- it is more important to prevent infinitly long output lines.
  449.  *
  450.  * instring and inmarcor are parameters to the get() routine which
  451.  * were made global for speed.
  452.  */
  453. int        instring = FALSE;    /* TRUE if scanning string    */
  454. int        inmacro = FALSE;    /* TRUE if #defining a macro    */
  455.  
  456. /*
  457.  * work[] and workp are used to store one piece of text in a temporay
  458.  * buffer.  To initialize storage, set workp = work.  To store one
  459.  * character, call save(c);  (This will fatally exit if there isn't
  460.  * room.)  To terminate the string, call save(EOS).  Note that
  461.  * the work buffer is used by several subroutines -- be sure your
  462.  * data won't be overwritten.  The extra byte in the allocation is
  463.  * needed for string formal replacement.
  464.  */
  465. char        work[NWORK + 1];    /* Work buffer            */
  466. char        *workp;         /* Work buffer pointer        */
  467.  
  468. /*
  469.  * keepcomments is set TRUE by the -C option.  If TRUE, comments
  470.  * are written directly to the output stream.  This is needed if
  471.  * the output from cpp is to be passed to lint (which uses commands
  472.  * embedded in comments).  cflag contains the permanent state of the
  473.  * -C flag.  keepcomments is always falsified when processing #control
  474.  * commands and when compilation is supressed by a false #if
  475.  *
  476.  * If eflag is set, CPP returns "success" even if non-fatal errors
  477.  * were detected.
  478.  *
  479.  * If nflag is non-zero, no symbols are predefined except __LINE__.
  480.  * __FILE__, and __DATE__.  If nflag > 1, absolutely no symbols
  481.  * are predefined.
  482.  */
  483. int        keepcomments = FALSE;    /* Write out comments flag    */
  484. int        cflag = FALSE;        /* -C option (keep comments)    */
  485. int        eflag = FALSE;        /* -E option (never fail)       */
  486. int        nflag = 0;        /* -N option (no predefines)    */
  487. int        wflag = FALSE;        /* -W option (write #defines)   */
  488.  
  489. /*
  490.  * ifstack[] holds information about nested #if's.  It is always
  491.  * accessed via *ifptr.  The information is as follows:
  492.  *    WAS_COMPILING    state of compiling flag at outer level.
  493.  *    ELSE_SEEN    set TRUE when #else seen to prevent 2nd #else.
  494.  *    TRUE_SEEN    set TRUE when #if or #elif succeeds
  495.  * ifstack[0] holds the compiling flag.  It is TRUE if compilation
  496.  * is currently enabled.  Note that this must be initialized TRUE.
  497.  */
  498. char        ifstack[BLK_NEST] = { TRUE };    /* #if information    */
  499. char        *ifptr = ifstack;        /* -> current ifstack[] */
  500.  
  501. /*
  502.  * incdir[] stores the -i directories (and the system-specific
  503.  * #include <...> directories.
  504.  */
  505. char    *incdir[NINCLUDE];        /* -i directories        */
  506. char    **incend = incdir;        /* -> free space in incdir[]    */
  507.  
  508. /*
  509.  * This is the table used to predefine target machine and operating
  510.  * system designators.    It may need hacking for specific circumstances.
  511.  * Note: it is not clear that this is part of the Ansi Standard.
  512.  * The -N option supresses preset definitions.
  513.  */
  514. char    *preset[] = {            /* names defined at cpp start    */
  515. #ifdef    MACHINE
  516.     MACHINE,
  517. #endif
  518. #ifdef    SYSTEM
  519.     SYSTEM,
  520. #endif
  521. #ifdef    COMPILER
  522.     COMPILER,
  523. #endif
  524. #if    DEBUG
  525.     "decus_cpp",                    /* Ourselves!                   */
  526. #endif
  527.     NULL                /* Must be last         */
  528. };
  529.  
  530. /*
  531.  * The value of these predefined symbols must be recomputed whenever
  532.  * they are evaluated.    The order must not be changed.
  533.  */
  534. char    *magic[] = {            /* Note: order is important    */
  535.     "__LINE__",
  536.     "__FILE__",
  537.     NULL                /* Must be last         */
  538. };
  539.  
  540. main(argc, argv)
  541. int        argc;
  542. char        *argv[];
  543. {
  544.     register int    i;
  545.     extern FILE *freopen ();
  546.  
  547.     DBUG_ENTER ("main");
  548.     DBUG_PUSH ("d:t");
  549. #if HOST == SYS_VMS
  550.     argc = getredirection(argc, argv);      /* vms >file and <file  */
  551. #endif
  552.     initdefines();                          /* O.S. specific def's  */
  553.     i = dooptions(argc, argv);              /* Command line -flags  */
  554.     switch (i) {
  555.     case 3:
  556.         /*
  557.          * Get output file, "-" means use stdout.
  558.          */
  559.         if (!streq(argv[2], "-")) {
  560. #if HOST == SYS_VMS
  561.         /*
  562.          * On vms, reopen stdout with "vanilla rms" attributes.
  563.          */
  564.         if ((i = creat(argv[2], 0, "rat=cr", "rfm=var")) == -1
  565.          || dup2(i, fileno(stdout)) == -1) {
  566. #else
  567.         if (freopen(argv[2], "w", stdout) == NULL) {
  568. #endif
  569.             perror(argv[2]);
  570.             cerror("Can't open output file \"%s\"", argv[2]);
  571.             exit(IO_ERROR);
  572.         }
  573.         }                /* Continue by opening input    */
  574.     case 2:             /* One file -> stdin        */
  575.         /*
  576.          * Open input file, "-" means use stdin.
  577.          */
  578.         if (!streq(argv[1], "-")) {
  579.         if (freopen(argv[1], "r", stdin) == NULL) {
  580.             perror(argv[1]);
  581.             cerror("Can't open input file \"%s\"", argv[1]);
  582.             exit(IO_ERROR);
  583.         }
  584.         strcpy(work, argv[1]);  /* Remember input filename      */
  585.         break;
  586.         }                /* Else, just get stdin     */
  587.     case 0:             /* No args?            */
  588.     case 1:             /* No files, stdin -> stdout    */
  589. #if HOST == SYS_UNIX || HOST == SYS_AMIGADOS
  590.         work[0] = EOS;        /* Unix can't find stdin name   */
  591. #else
  592.         fgetname(stdin, work);      /* Vax-11C, Decus C know name   */
  593. #endif
  594.         break;
  595.  
  596.     default:
  597.         exit(IO_ERROR);             /* Can't happen                 */
  598.     }
  599.     setincdirs();                   /* Setup -I include directories */
  600.     addfile(stdin, work);           /* "open" main input file       */
  601. #if DEBUG
  602.     if (debug > 0)
  603.         dumpdef("preset #define symbols");
  604. #endif
  605.     cppmain();                      /* Process main file            */
  606.     if ((i = (ifptr - &ifstack[0])) != 0) {
  607. #if OLD_PREPROCESSOR
  608.         ciwarn("Inside #ifdef block at end of input, depth = %d", i);
  609. #else
  610.         cierror("Inside #ifdef block at end of input, depth = %d", i);
  611. #endif
  612.     }
  613.     fflush(stdout);
  614.     fclose(stdout);
  615.     if (errors > 0 && !eflag)
  616.       DBUG_RETURN(IO_ERROR);
  617.     DBUG_RETURN(IO_NORMAL);         /* No errors or -E option set   */
  618. }
  619.  
  620. FILE_LOCAL
  621. cppmain()
  622. /*
  623.  * Main process for cpp -- copies tokens from the current input
  624.  * stream (main file, include file, or a macro) to the output
  625.  * file.
  626.  */
  627. {
  628.     register int        c;        /* Current character    */
  629.     register int        counter;    /* newlines and spaces    */
  630.     extern int        output();       /* Output one character */
  631.  
  632.     DBUG_ENTER ("cppmain");
  633.     /* Initialize for reading tokens */
  634.     tokenbsize = 50;
  635.     tokenbuf = getmem (tokenbsize + 1);
  636.  
  637.     /*
  638.      * Explicitly output a #line at the start of cpp output so
  639.      * that lint (etc.) knows the name of the original source
  640.      * file.  If we don't do this explicitly, we may get
  641.      * the name of the first #include file instead.
  642.      */
  643.     sharp();
  644.     /*
  645.      * This loop is started "from the top" at the beginning of each line
  646.      * wrongline is set TRUE in many places if it is necessary to write
  647.      * a #line record.  (But we don't write them when expanding macros.)
  648.      *
  649.      * The counter variable has two different uses:  at
  650.      * the start of a line, it counts the number of blank lines that
  651.      * have been skipped over.  These are then either output via
  652.      * #line records or by outputting explicit blank lines.
  653.      * When expanding tokens within a line, the counter remembers
  654.      * whether a blank/tab has been output.  These are dropped
  655.      * at the end of the line, and replaced by a single blank
  656.      * within lines.
  657.      */
  658.     for (;;) {
  659.         counter = 0;            /* Count empty lines    */
  660.         for (;;) {                          /* For each line, ...   */
  661.         while (type[(c = get())] == SPA) /* Skip leading blanks */
  662.             ;                /* in this line.    */
  663.         if (c == '\n')                  /* If line's all blank, */
  664.             ++counter;            /* Do nothing now    */
  665.         else if (c == '#') {            /* Is 1st non-space '#' */
  666.             keepcomments = FALSE;    /* Don't pass comments  */
  667.             counter = control(counter); /* Yes, do a #command   */
  668.             keepcomments = (cflag && compiling);
  669.         }
  670.         else if (c == EOF_CHAR)         /* At end of file?      */
  671.             break;
  672.         else if (!compiling) {          /* #ifdef false?        */
  673.             skipnl();                   /* Skip to newline      */
  674.             counter++;            /* Count it, too.    */
  675.         }
  676.         else {
  677.             break;            /* Actual token     */
  678.         }
  679.         }
  680.         if (c == EOF_CHAR)                  /* Exit process at      */
  681.         break;                /* End of file        */
  682.         /*
  683.          * If the loop didn't terminate because of end of file, we
  684.          * know there is a token to compile.  First, clean up after
  685.          * absorbing newlines.  counter has the number we skipped.
  686.          */
  687.         if ((wrongline && infile->fp != NULL) || counter > 4)
  688.         sharp();                        /* Output # line number */
  689.         else {                /* If just a few, stuff */
  690.         while (--counter >= 0)          /* them out ourselves   */
  691.             putchar('\n');
  692.         }
  693.         /*
  694.          * Process each token on this line.
  695.          */
  696.         unget();                            /* Reread the char.     */
  697.         for (;;) {                          /* For the whole line,  */
  698.         do {                /* Token concat. loop    */
  699.             for (counter = 0; (type[(c = get())] == SPA);) {
  700. #if COMMENT_INVISIBLE
  701.             if (c != COM_SEP)
  702.                 counter++;
  703. #else
  704.             counter++;        /* Skip over blanks    */
  705. #endif
  706.             }
  707.             if (c == EOF_CHAR || c == '\n')
  708.             goto end_line;        /* Exit line loop    */
  709.             else if (counter > 0)       /* If we got any spaces */
  710.             putchar(' ');           /* Output one space     */
  711.             c = macroid(c);             /* Grab the token       */
  712.         } while (type[c] == LET && catenate());
  713.         if (c == EOF_CHAR || c == '\n') /* From macro exp error */
  714.             goto end_line;        /* Exit line loop    */
  715.         switch (type[c]) {
  716.         case LET:
  717.             fputs(tokenbuf, stdout);    /* Quite ordinary token */
  718.             break;
  719.  
  720.  
  721.         case DIG:            /* Output a number    */
  722.         case DOT:            /* Dot may begin floats */
  723.             scannumber(c, output);
  724.             break;
  725.  
  726.         case QUO:            /* char or string const */
  727.             scanstring(c, output);      /* Copy it to output    */
  728.             break;
  729.  
  730.         default:            /* Some other character */
  731.             cput(c);                    /* Just output it       */
  732.             break;
  733.         }                /* Switch ends        */
  734.         }                    /* Line for loop    */
  735. end_line:   if (c == '\n') {                    /* Compiling at EOL?    */
  736.         putchar('\n');                  /* Output newline, if   */
  737.         if (infile->fp == NULL)         /* Expanding a macro,   */
  738.             wrongline = TRUE;        /* Output # line later    */
  739.         }
  740.     }                    /* Continue until EOF    */
  741.     if (wflag)
  742.         outdefines();                       /* Write out #defines   */
  743.     DBUG_VOID_RETURN;
  744. }
  745.  
  746. output(c)
  747. int        c;
  748. /*
  749.  * Output one character to stdout -- output() is passed as an
  750.  * argument to scanstring()
  751.  */
  752. {
  753. #if COMMENT_INVISIBLE
  754.     if (c != TOK_SEP && c != COM_SEP)
  755. #else
  756.     if (c != TOK_SEP)
  757. #endif
  758.         putchar(c);
  759. }
  760.  
  761. static char    *sharpfilename = NULL;
  762.  
  763. FILE_LOCAL
  764. sharp()
  765. /*
  766.  * Output a line number line.
  767.  */
  768. {
  769.     register char        *name;
  770.  
  771.     DBUG_ENTER ("sharp");
  772.     if (keepcomments)                       /* Make sure # comes on */
  773.         putchar('\n');                      /* a fresh, new line.   */
  774.     printf("#%s %d", LINE_PREFIX, line);
  775.     if (infile->fp != NULL) {
  776.         name = (infile->progname != NULL)
  777.         ? infile->progname : infile->filename;
  778.         if (sharpfilename == NULL
  779.          || sharpfilename != NULL && !streq(name, sharpfilename)) {
  780.         if (sharpfilename != NULL)
  781.             free(sharpfilename);
  782.         sharpfilename = savestring(name);
  783.         printf(" \"%s\"", name);
  784.          }
  785.     }
  786.     putchar('\n');
  787.     wrongline = FALSE;
  788.     DBUG_VOID_RETURN;
  789. }
  790.